期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于稀疏轨迹聚类的自驾车旅游路线挖掘
杨奉毅, 马玉鹏, 包恒彬, 韩云飞, 马博
计算机应用    2020, 40 (4): 1079-1084.   DOI: 10.11772/j.issn.1001-9081.2019081467
摘要568)      PDF (1419KB)(583)    收藏
针对自驾车游客加油轨迹稀疏,还原真实旅游路线困难的问题,提出一种基于语义表示的稀疏轨迹聚类算法,用以挖掘流行的自驾车旅游路线。与基于轨迹点匹配的传统轨迹聚类算法不同,该算法考虑不同轨迹点之间的语义关系,学习轨迹的低维向量表示。首先,利用神经网络语言模型学习加油站点的分布式向量表示;然后,取每条轨迹中所有站点向量的平均值作为该轨迹的向量表示;最后,采用经典的k均值算法对轨迹向量进行聚类。最终的可视化结果表明,所提算法有效地挖掘出了两条流行的自驾车旅游线路。
参考文献 | 相关文章 | 多维度评价
2. 基于双向LSTM的Seq2Seq模型在加油站时序数据异常检测中的应用
陶涛, 周喜, 马博, 赵凡
计算机应用    2019, 39 (3): 924-929.   DOI: 10.11772/j.issn.1001-9081.2018081681
摘要1911)      PDF (936KB)(588)    收藏

加油时序数据包含加油行为的多维信息,但是指定加油站点数据较为稀疏,现有成熟的数据异常检测算法存在挖掘较多假性异常点以及遗漏较多真实异常点的缺陷,并不适用于挖掘加油站时序数据。提出一种基于深度学习的异常检测方法识别加油异常车辆,首先通过自动编码器对加油站点采集到的相关数据进行特征提取,然后采用嵌入双向长短期记忆(Bi-LSTM)的Seq2Seq模型对加油行为进行预测,最后通过比较预测值和原始值来定义异常点的阈值。通过在加油数据集以及信用卡欺诈数据集上的实验验证了该方法的有效性,并且相对于现有方法在加油数据集上均方根误差(RMSE)降低了21.1%,在信用卡欺诈数据集上检测异常的准确率提高了1.4%。因此,提出的模型可以有效应用于加油行为异常的车辆检测,从而提高加油站的管理和运营效率。

参考文献 | 相关文章 | 多维度评价
3. 基于融合时空数据的车辆加油行为多视图深度异常检测框架
丁景全, 马博, 李晓
计算机应用    2019, 39 (11): 3370-3375.   DOI: 10.11772/j.issn.1001-9081.2019040670
摘要409)      PDF (988KB)(272)    收藏
车辆加油时空数据多源异构、关系复杂,现有成熟的异常检测方法难以对时空离散的加油活动数据进行分析,因此提出基于融合时空数据的车辆加油行为多视图深度异常检测框架。首先基于统一概念模型(UCM)对静态信息和动态活动数据进行关联融合管理,然后从空间视图、时间视图和语义视图角度对时空数据进行编码和转换,最后基于三种视图构建深度时空异常分析检测框架。车辆加油时空数据集上的实验结果表明,多种异常检测方法在融合时空数据上均可取得更低均方根误差(RMSE),平均降低10.73%,所提方法比现有主流方法中结果最好的长短时记忆网络(LSTM)的RMSE降低19.36%。在信用卡欺诈公开数据集上的实验结果表明,所提方法较之逻辑回归模型,马修斯系数(MCC)提高了32.78%。以上实验验证了所提方法的有效性。
参考文献 | 相关文章 | 多维度评价
4. 基于动态可配置规则的数据清洗方法
朱会娟, 蒋同海, 周喜, 程力, 赵凡, 马博
计算机应用    2017, 37 (4): 1014-1020.   DOI: 10.11772/j.issn.1001-9081.2017.04.1014
摘要822)      PDF (1069KB)(598)    收藏
针对传统数据清洗方法通过硬编码方法来实现业务逻辑而导致系统的可重用性、可扩展性与灵活性较差等问题,提出了一种基于动态可配置规则的数据清洗方法——DRDCM。该方法支持多种类型规则间的复杂逻辑运算,并支持多种脏数据修复行为,集数据检测、数据修复与数据转换于一体,具有跨领域、可重用、可配置、可扩展等特点。首先,对DRDCM方法中的数据检测和数据修复的概念、实现步骤以及实现算法进行描述;其次,阐述了DRDCM方法中支持的多种规则类型以及规则配置;最后,对DRDCM方法进行实现,并通过实际项目数据集验证了该实现系统在脏数据修复中,丢弃修复行为具有很高的准确率,尤其是对需遵守法定编码规则的属性(例如身份证号码)处理时其准确率可达100%。实验结果表明,DRDCM实现系统可以将动态可配置规则无缝集成于多个数据源和多种不同应用领域且该系统的性能并不会随着规则条数增加而极速降低,这也进一步验证了DRDCM方法在真实环境中的切实可行性。
参考文献 | 相关文章 | 多维度评价
5. 类自动车牌识别轨迹数据的伴随车辆组挖掘
王保全, 蒋同海, 周喜, 马博, 赵凡
计算机应用    2017, 37 (11): 3064-3068.   DOI: 10.11772/j.issn.1001-9081.2017.11.3064
摘要776)      PDF (908KB)(527)    收藏
自动车牌识别(ANPR)数据比私人全球定位系统(GPS)数据更易获得,且包含更有用的信息,但是相对成熟的针对GPS轨迹数据挖掘伴随车辆组方法并不适用于自动车牌识别数据,现有的少量自动车牌识别数据伴随车辆组挖掘算法存在重视轨迹相似而忽视时间因素的缺陷,因此提出一种基于轨迹特征的聚类方法挖掘伴随车辆组。针对自动车牌识别数据中采样点固定而采样时间不定的特点,通过轨迹中共现的次数判定两个对象构成伴随模式。该共现定义引入豪斯多夫距离,综合考虑轨迹的地点、方向和时间特征,旨在挖掘数据中采样点不同但采样点距离近且轨迹相似的伴随车辆组,以此提高伴随车辆组挖掘效率。实验结果表明,所提方法较现有方法更能有效挖掘伴随车辆组,识别非伴随模式数据,效率提升了近两倍。
参考文献 | 相关文章 | 多维度评价
6. 基于Linux驱动级内核访问监控技术研究与实现
马博 袁丁
计算机应用    2009, 29 (09): 2369-2374.  
摘要1405)      PDF (922KB)(1620)    收藏
针对POSIX.1e标准的权能模块的缺陷进行了改进,在Linux内核安全模块(LSM)框架基础上,加载改进的模块,对操作系统内核层进行监听和控制处理,完成进程信任状特权仲裁、安全i节点(i-node)操作、信息队列反馈等一系列操作,最后调用字符设备反馈监控信息到应用层进行安全控制处理。实验表明,改进方案与加载原有权能模块Linux内核的方法相比,不仅在系统的运行效率、监控的正确率和系统扫描覆盖率上有所提高,而且在系统资源占用率等多项指标中都显示其具有良好的监控性能。
相关文章 | 多维度评价
7. Linux下的高流量数据包监听技术
马博 袁丁
计算机应用    2009, 29 (05): 1244-1250.  
摘要1082)      PDF (708KB)(1357)    收藏
研究了Linux操作系统中使用底层抓包函数库Libpcap处理高量数据包监听的原理,利用网卡设备在网络的旁路处进行数据捕捉后预处理,利用NAPI技术实现设备半轮询机制以加快数据在缓冲区的处理速度,最后利用排队论原理计算最优带宽值并设置相关参数以达到最佳处理效率。实验表明,该方法不仅提高数据包的捕捉率,并且在系统资源占用率等多项指标中都有显著改善。
相关文章 | 多维度评价
8. CCML2017+会议文章254+类ANPR轨迹数据的伴随车辆组挖掘
王保全 蒋同海 周喜 马博 赵凡
  
录用日期: 2017-06-05